Vencendo a escassez de recursos computacionais. Carvalho: Tradutor Automático Estatístico Inglês-Galego a partir do corpus paralelo Europarl Inglês-Português
نویسندگان
چکیده
À hora de desenvolver muitas ferramentas estat́ısticas de Processamento da Linguagem Natural tornase essencial a utilização de grandes quantidades de dados. Para salvar a limitação da escassez de recursos computacionais para ĺınguas minorizadas como o galego é necessário desenhar novas estratégias. No caso do galego, importantes romanistas têm teorizado que galego e português são variantes do português europeu. De um ponto de vista pragmático, esta hipótese poderia abrir uma nova linha de investigação para fornecer ao galego ricos recursos computacionais. Partindo do corpus paralelo inglês–português Europarl, imaxin|software compilou um corpus paralelo inglês–galego que utilizamos para criar um protótipo de tradutor automático estat́ıstico inglês–galego, cuja performance é comparável a Google Translate. Mantemos que é posśıvel implementar esta estratégia para desenvolver uma grande variedade de ferramentas computacionais para ĺınguas, como o galego, intimamente relacionadas com ĺınguas que já contam com um grande repertório de recursos computacionais.
منابع مشابه
Apresentação do projecto Per-Fide: Paralelizando o Português com seis outras línguas
Neste documento apresentamos o projecto Per-Fide que tem como principal objectivo a criação de recursos bilingues entre a ĺıngua portuguesa e seis outras ĺınguas: espanhol, russo, francês, italiano, alemão e inglês. Este processo iniciar-se-á com a compilação de corpora paralelos em diferentes áreas, nomeadamente a literatura, religião e poĺıtica (legislativa e juŕıdica) e técnico-cient́ıfica. O...
متن کاملPorTAl: Recursos e Ferramentas de Tradução Automática para o Português do Brasil (PorTAl: Resources and Tools for Machine Translation of Brazilian Portuguese) [in Portuguese]
This paper describes the machine translation (MT) site PorTAl developed aiming at integrating useful tools and resources for MT and the multilingual processing. Currently under development, the PorTAl will provide tools and resources for Brazilian Portuguese, English and Spanish (initially). In a near future we believe that the PorTAl will stimulate a progress in multilingual applications, part...
متن کاملExtração de Vocabulário Multilíngue para Tradução em Domínios Especializados (Multilingual Vocabulary Extraction for Machine Translation in Specialized Domains) [in Portuguese]
This paper presents a process for multilingual vocabulary extraction which aims to auxiliate machine translation tools during the intermediation of the communication between multilingual teams. Resumo. Este trabalho apresenta um processo para a extração de vocabulário multilı́ngue proposto com o objetivo de auxiliar ferramentas de tradução de máquina durante a intermediação da comunicação entre ...
متن کاملThe language issue in Brazilian ophthalmological journals.
Nesta edição do Arquivos Brasileiros de Oftalmologia (ABO), Lira et al., estudaram a qualidade dos periódicos oftalmológicos brasileiros por meio do número de citações em fontes indexadas no Science Citation Index Expanded (SCIE) após dois anos da publicação (Fator de Impacto®) e da qualidade dos artigos de acordo com o Consolidated Standards for Reporting Trials (CONSORT). As publicações são e...
متن کاملAnálise Morfossintáctica para Português Europeu e Galego: Problemas, Soluções e Avaliação
As diferentes tarefas de análise morfossintáctica têm muita importância para posteriores níveis do processamento da linguagem natural. Por isso, estes processos devem ser realizados com ferramentas que garantam bons desempenhos em relação à cobertura, precisão e robustez na análise. FreeLing é uma suite com licença GPL desenvolvida pelo Grupo TALP da Universitat Politècnica de Catalunya. Este s...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Linguamática
دوره 2 شماره
صفحات -
تاریخ انتشار 2010